from Bio import SeqIO
import random
codones_file = open('codones_seleccionados_nuevos')
codones = {}
for line in codones_file:
    codones[line.strip()] = 0
fin = open('genomas_utilizar')
for line in fin:
    line = line.strip()
    secuencias = list(SeqIO.parse(open(line), 'fasta'))[0]
    fout = open('secuencias_'+line, 'w')
    for i in range(0, 500):
        inicio = random.randint(0, (len(secuencias.seq)-1000))
        fout.write('>{0}\n{1}\n'.format(secuencias.id, str(secuencias.seq[inicio:inicio+1000])))
    fout.close()
    fout = open('preprocesamiento_'+line, 'w')
    secuencias =  list(SeqIO.parse(open('secuencias_'+line), 'fasta'))
    for seq in secuencias:
        for i in range(0, len(seq.seq) - 2):
            try:
                codones[str(seq.seq[i:i+3])] +=1
            except:
                continue
        fout.write(seq.id+'\t')
        codones['C']=seq.seq[:].count('C')
        codones['G']=seq.seq[:].count('G')
        for codon, frecuencia in codones.items():
            fout.write(codon + ':' + str(frecuencia/1000.0)+'\t')
            codones[codon] = 0
        fout.write('\n')
